#диффузионные политики30.06.2025
DSRL: Управление роботами через обучение с подкреплением в латентном пространстве для реальной адаптации
DSRL представляет инновационный метод адаптации диффузионных политик роботов с помощью обучения с подкреплением в латентном пространстве, значительно улучшая результаты в реальных условиях без изменения базовой модели.